Sommaire

Introduction

Les émissions de CO2 causent des problèmes majeurs, de nos jours, tels que: le réchauffement climatique, la destruction de la couche d’ozone, etc. Ce qui a des conséquences néfastes sur notre planète et les êtres qui y vivent.

Nous essaierons à travers ce projet d’analyser les émissions de CO2 par pays en fonction du temps et du PIB par habitant en parité de pouvoir d’achat. Nous contrôlerons cet indicateur économique par d’autres variables principalement associées à la manière de produire et consommer notre énergie.

I) Collecte de données

La collecte des données est une étape incontournable pour répondre à notre problématique.

Nous avons pu faire cette étape grâce aux données disponibles sur le site de la banque mondiale: https://databank.worldbank.org/source/world-development-indicators.

Ces données sont composées de 1500 observations et 11 variables, qui sont:

Cependant, les données collectées requièrent un traitement avant de pouvoir les utiliser.

II) Traitement de données

La base de données présentait de nombreuses données manquantes les années les plus récentes. De ce fait nous avons choisi de ne conserver que les années de 2003 à 2014. Ce choix nous a permis de conserver quasiment la totalité des pays du monde même après suppression des données manquantes.

Enfin, nous avons défini des variables logarithmiques telles que (log(GDP_PPP) et log(CO2_emissions)).

Nous nous retrouvons donc avec des données en Panel (axe pays et axe temps).

III) Description de la base de données


=================================================================
Statistic           N      Mean     St. Dev.    Min       Max    
-----------------------------------------------------------------
Time              1,500 2,008.500    3.453     2,003     2,014   
GDP_PPP           1,500 22,540.070 21,299.750 708.029 120,647.800
CO2_emissions     1,500   5.707      6.331     0.035    47.657   
Agricultural_land 1,500   39.557     20.844    0.449    85.287   
Clean_energy      1,500   7.643      10.533    0.000    55.577   
Electric_power    1,500 4,337.439  5,819.712  23.916  54,799.180 
log_GDP_PPP       1,500   9.527      1.095     6.562    11.701   
log_GDP_PPP_2     1,500   91.962     20.408   43.066    136.905  
log_CO2           1,500   1.029      1.417    -3.341     3.864   
-----------------------------------------------------------------

Après avoir traité les données, nous avons une base contenant 10 variables et 1500 observations. En effet, sur le tableau ci-dessus, une des variables est absente car c’est celle qui représente les différents pays (chaine de caractère).

On remarque sur notre base:

Toutes ses informations nous reconfortent sur la diversité des données dont on dispose.

Cartographie

Notre base de données contient des pays du monde. De ce fait, Nous avons pensé à identifier les pays et à permettre une observation sur carte des disparités.

On peut voir sur la carte que notre jeu de données contient beaucoup de pays. De plus, leurs superficies, leurs nombre d’habitants, leur niveau de développement sont toutes différentes.

Ce qui montre la diversité et l’hétérogénéite de notre base.

A première vue, on remarque que les pays les plus grands en superficie ont émis plus de CO2 de 2003 à 2014.

Ces pays sont en général en Amerique du Nord, en Europe, en Asie et en Océanie. Pour l’Afrique, on en remarque quelques; mais l’absence de plusieurs pays africains de notre base de données ne nous permet pas de les inclure parmi les zones ayant émis le plus de CO2 de 2003 à 2014.

On remarque que, contrairement au cumul des émissions de CO2 de 2003 à 2014, les pays ayant les PIB PPP par habitants les plus élevés n’étaient sont pas forcément ceux plus grands en superficie.

Les zones abritant ces pays sont l’Amerique du Nord, l’Europe et l’Australie.

Statistiques descriptives

Treemap

On observe qu’en 2003, les pays ayant émis le plus de CO2 étaient: le Qatar, le Koweit et les Emirats Arabes.

On observe qu’en 2014, les pays ayant le plus émis de CO2 étaient: le Qatar, le Bahrain et le Koweit.

On observe qu’en 2003, les pays ayant le plus grand PIB PPP par habitant étaient: le Luxembourg, les Emirats Arabes et le Qatar.

On observe qu’en 2014, les pays ayant le plus grand PIB PPP par habitant étaient: le Luxembourg, le Qatar et le Singapour

Barplot

On remarque que les pays ayant le plus émis du CO2 de 2003 à 2014 sont le Qatar, le Koweit et les Emirats Arabes.

Boite à moustache

En observant ces boites à moustache, on note que la variabilité des émissions de CO2 par habitant au cours du temps diffère en fonction du pays. Par exemple, cette variabilité est très faible pour l’Autralie et élevée pour Brunei ou les Emirats Arabes Unis. On notera que les émissions de CO2 par habitant du Quatar sont significativement supérieures à celles des autres pays affichées sur le graphique.

Nuage de point

Le graphique nous montre le type de relation entre le logarithme des émissions de CO2 par habitant (log_CO2) et le logarithme du PIB PPP par habitant (log_GDP_PPP), pour les 10 pays ayant le plus émis du CO2 par habitant de 2003 à 2014 en cumulé. On remarque que les nuages de point ont les allures suivant:

  • Allure linéaire: pour les Emirats Arabes, le Bahrein, le Koweit, l’Australie, le Brunei et le Canada;
  • Allure aléatoire: pour le Qatar, les USA et le Luxembourg;
  • Allure logarithmique: pour l’Oman.

Pour la majorité de ces 10 pays, on constate une relation lineaire entre le log_GDP_PPP et le log_CO2.

Evolution

Pour les 10 pays ayant émis le plus de CO2 par habitant, de 2003 à 2014, en cumulé, l’évolution des surfaces agricoles est quasi constante ou monotone pour la majorité de ces pays.

Cependant, nous remarquons quelques exceptions. Notamment l’Australie pour laquelle l’évolution des surfaces agricoles n’est pas monotone.

Nous avons aussi les Emirats Arabes pour lesquels l’évolution des surfaces agricole était quasi constante de 2003 à 2008; puis elle a soudainement baissé en 2009; ensuite elle est redevenue quasi constante de 2009 à 2014. Ce qui est surement du à la hausse des barils de pétrole en 2008, ce qui les a poussé à favoriser le pétrole au détriment des terres agricoles.

Parmi les 10 pays ayant émis le plus de CO2 par habitant, de 2003 à 2014, en cumulé, il y en a 4 qui utilisent des énergies vertes. Ce qui est compréhensible car les 6 autres pays étaient: des pays en émergence, des pays situés dans une zone désertique et des zones ayant du pétrole; d’où l’absence d’énergies vertes.

Pour le Canada, le Luxembourg, les USA et l’Australie, leur utilisation d’énergies vertes a cru entre 2003 et 2014. Ceci grace à leur décision d’incorporer l’aspect environnementale dans leurs différents projet.

On peut voir que pour les 10 pays ayant les plus émis du CO2 par habitant, la puissance électrique est différente en fonction du pays. On observe 2 types d’évolution:

  • Evolution monotone: pour l’Oman, les USA, le Brunei et l’Australie;
  • Evolution non monotone(irreguliere): pour le Bahrein, le Canada, le Koweit, le Luxembourg, le Qatar et les Emirats Arabes

De plus les 5 pays utilisant le plus d’électricité sont: le Bahrein, le Canada, le Koweit, le Luxembourg et le Qatar.

Corrélation

On remarque que les variables \(log(CO2)\) ainsi que \(log(GDP_{PPP})\) sont fortement et positivement corrélées. Cela signifierait que plus un pays est riche, plus les émissions de CO2 de ses habitants augmentent. Le lien de causalité entre ces deux variables reste à démontrer.

IV) Modélisation

Choix du modèle

Les pays sélectionnés pour cette étude sont très diversifiés et possèdent des caractéristiques propres que l’on supposera constantes au cours de la période d’étude choisie (2003-2014). Une liste non exhaustive d’exemples concrets de caractéristiques pouvant potentiellement impacter la quantité de CO2 émis par habitant est donnée ci-dessous:

  • Régime politique
  • Géographie et climat
  • Ressources naturelles
  • Politique environnementale

Nous priviligierons donc un modèle à effets fixes à un modèle à effets aléatoires.

Nous n’étudierons pas le modèle hétérogène car nous ne disposons pas d’assez d’observations temporelles par pays (T=12). Un tel modèle aurait pourtant pu s’avérer intéressant à étudier car il semble selon nous possible que l’impact d’une variable sur les émissions de CO2 soit différent d’un pays à un autre.

Nous commençons donc par définir deux modèles :

  • Modèle pooled sans effets fixes
  • Modèle within avec effets fixes

Le modèle pooled présuppose que l’impact d’une variable sur les émissions de CO2 ne dépend pas du pays et qu’il n’existe pas d’effets fixes. Nous ne pouvons pas exclure à ce stade qu’il n’existe pas d’effets fixes même si cette hypothèse paraît très peu probable.

Le modèle within permet la prise en compte des effets fixes tout en s’affranchissant des problèmes de grande dimension qu’induisent la création de variables dummy. Ici, le modèle within soustrait la moyenne de chaque unité (pays) pour chaque variable du modèle, permettant l’élimination des variables dummy.

Le choix du modèle sera déterminé par le test d’hypothèse ci-dessous permettant de détecter la présence d’effets fixes.

F test for individual effects
Statistic df1 df2 p-value
239.19 124 1370 0

A l’issue du test, nous constatons que la p-value est significative au seuil de 5%. Nous rejetons donc l’hypothèse nulle statuant de l’absence d’effets fixes individuels au sein du modèle. Ainsi, nous retiendrons le modèle à effets fixes individuels implémanté grâce à la méthode “within”. Il serait néanmoins prématuré de se référer aux coefficients associés à ce modèle. Ces derniers peuvent être biaisés si les hypothèses de base de la méthode des moindres carrés ordinaires ne sont pas respectés. Nous chercherons donc ci-dessous à vérifier les hypothèse d’homoscédasticité et d’absence d’autocorrélation de résidus.

Breusch-Pagan LM test for cross-sectional dependence in panels
Statistic df p-value
34829.55 7750 0
Breusch-Godfrey/Wooldridge test for serial correlation in panel models
Statistic df p-value
737.07 12 0

Pour les deux tests, la p-value est significative au seuil de 5%. On rejette donc les hypothèses nulles d’homoscédasticité et d’absence d’autocorrélation des résidus. Ainsi, les résidus sont hétéroscédastiques et autocorrélés, violant deux des hypothèses de base du modèle. Il est donc à craindre que les coefficients estimés par le modèle soient biaisés. De même, les tests permettant de juger de la significativité de ces coefficients perdent en fiabilité. Une solution pour corriger ce problème reste la méthode des moindres carrés généralisés.

Résultats du modèle

La méthode des moindres carrés généralisés introduit une matrice de pondération qui capture la structure de covariance des résidus. Cette matrice est utilisée pour pondérer les observations de manière adaptée, permettant de donner plus d’importance aux observations moins sujettes à l’hétéroscédasticité ou à l’autocorrélation. L’estimateur des moindres carrés généralisés demeure non biaisé et convergent. Nous implémantons donc cet estimateur en conservant bien sûr les effets fixes individuels. De même, les variables restent centrées pour se prémunir des problèmes liés à la grande dimension.

Oneway (individual) effect Within FGLS model on a balanced Panel: n = 125, T = 12, N = 1500
Coefficient Standard error z-value p-value
log(GDP per capita PPP) 1.66 0.33 5.06 0.00
log(GDP per capita PPP)² -0.06 0.02 -3.57 0.00
Agricultural land 0.00 0.00 0.19 0.19
Clean energy -0.02 0.00 -12.63 0.00
Electric power 0.00 0.00 2.91 0.00

La seule variable non significative du modèle correspond à la surface agricole. Elle n’aurait donc aucune relation de cause à effet avec les émissions de CO2. Cela reste à première vue étonnant car on pourrait penser qu’une augmentation de la surface agricole est réalisée au prix d’une diminution de la surface forestière. La capacité d’absorbtion du CO2 par les arbres diminuerait, entraînant une augmentation des émissions de CO2 d’un pays. Ceci ne reste qu’une supposition. Nous n’avons pas la connaissance métier nous permettant de réfléchir davantage.

Le coefficient associé à la variable liée à la consommation d’électricité est extrêmement proche de 0. La variable ressort significative car l’écart-type associé est encore plus proche de 0 que le coefficient estimé. Ainsi, cette variable aurait une relation de cause à effet avec les émission de CO2 négligeable. Cela peut paraître cohérent. En effet, on peut supposer qu’un pays produisant proprement son électricité ne soit pas affecté par une augmentation des émissions de CO2 à mesure que la demande en électricité augmente. En revanche, un pays produisant son électricité grâce à des centrales à charbon ou à gaz émettrait des quantités potentiellement importantes de CO2 même avec une faible demande.

La part d’énergie renouvelable ou nucléaire au sein du mix énergétique, dernière variable de contrôle, permettrait la diminution des émissions de CO2 à mesure d’une augmentation de son utilisation couplée à la diminution de la part d’énergies fossiles au sein du mix énergétique. Cela était attendu et déjà discuté ci-dessus.

En vue d’interpréter les coefficients associés aux termes d’intérêt, il est préférable de visualiser la courbe de la fonction quadratique calculée par le modèle. En effet, l’interprétation précise d’un modèle log-log avec un terme quadratique reste périlleuse. Nous tracerons donc ci-dessous la courbe d’équation suivante : \(log(CO2) = -0.06\times log(GDP)^2 + 1.66\times log(GDP)\).

Le tracé obtenu est simple d’interprétation : si l’on en croit le résultat, les émissions d’un pays en voie de développement augmentent à mesure qu’il s’enrichit jusqu’au franchissement d’un certain seuil de développement. Dès lors, les émissions de CO2 diminuent alors que la richesse du pays continue d’augmenter. Ce qui explique la forte émission de CO2 par habitant, du Qatar, du Koweit et des Emirats Arabes (de 2003 à 2014). Cette courbe est mieux connue et étudiée dans la littérature sous le nom de “Courbe de Kuznets”. On peut par exemple penser, qu’un pays pauvre n’aie pas les moyens de payer la construction d’infrastructures permettant la production et la consommation d’énergie et de technologie propres mais que cette situation change à mesure que celui-ci s’enrichit, d’où une diminution des émissions. Encore une fois, nous n’avons pas les compétences métier pour développer davantage ou vérifier notre propos.

Il est à noter que les coefficients associés aux variables d’intérêt restent susceptibles de changer en fonction des variables de contrôle sélectionnées. En raison d’un manque de connaissances des sciences environnementales et climatiques, il semble très probable que l’ensemble des variables de contrôles sélectionnées soit incomplet ou partiellement erroné et que par conséquent, les coefficients associés aux termes d’intérêt puissent être erronés même légèrement. Nous nous garderons ainsi d’apporter une conclusion ferme et définitive quant à la véracité de la courbe tracée et ce même si elle ne paraît pas aberrante. Il est préférable de se référer à la littérature existante à ce sujet.

Pour terminer, nous évoquons succintement les effets fixes calculés par le modèle.

Effets fixes individuels
Albania -9.46
Algeria -9.04
Angola -10.05
Argentina -9.14
Armenia -9.27
Australia -8.09
Austria -8.69
Azerbaijan -9.09
Bahrain -7.91
Bangladesh -10.78
Belarus -8.64
Belgium -8.39
Benin -10.21
Bolivia -9.61
Bosnia and Herzegovina -8.55
Botswana -9.62
Brazil -9.48
Brunei -8.14
Bulgaria -8.33
Cambodia -10.56
Cameroon -10.53
Canada -7.87
Chile -9.08
China -8.34
Colombia -9.75
Costa Rica -9.77
Croatia -8.98
Cyprus -8.78
Czech Republic -8.15
Democratic Republic of the Congo -11.54
Denmark -8.79
Dominican Republic -9.54
Ecuador -9.29
Egypt -9.30
El Salvador -9.89
Estonia -8.13
Ethiopia -11.21
Finland -8.25
France -8.54
Gabon -9.05
Georgia -9.58
Germany -8.51
Ghana -10.53
Greece -8.69
Guatemala -10.14
Haiti -11.03
Honduras -9.67
Hungary -8.88
Iceland -8.83
India -9.45
Indonesia -9.51
Iran -8.44
Iraq -8.83
Ireland -8.78
Israel -8.52
Italy -8.91
Ivory Coast -10.79
Jamaica -9.02
Japan -8.41
Jordan -9.03
Kazakhstan -8.10
Kenya -10.86
Kuwait -7.78
Kyrgyzstan -9.14
Latvia -9.18
Lebanon -9.14
Libya -8.46
Lithuania -9.00
Luxembourg -8.21
Macedonia -8.86
Malaysia -8.60
Malta -8.92
Mauritius -9.46
Mexico -9.12
Moldova -9.15
Mongolia -8.50
Morocco -9.58
Mozambique -10.67
Myanmar -10.83
Namibia -9.53
Nepal -11.19
Netherlands -8.69
New Zealand -8.66
Nicaragua -9.96
Niger -11.28
Nigeria -10.30
Norway -8.58
Oman -8.04
Pakistan -9.95
Panama -9.59
Paraguay -10.28
Peru -9.66
Philippines -9.97
Poland -8.56
Portugal -9.03
Qatar -7.49
Republic of Congo -9.63
Romania -9.02
Russia -8.05
Saudi Arabia -8.36
Senegal -10.05
Singapore -8.88
Slovakia -8.38
Slovenia -8.36
South Africa -8.37
South Korea -8.14
Spain -8.76
Sri Lanka -10.46
Sudan -10.67
Suriname -9.03
Sweden -8.65
Switzerland -8.72
Tajikistan -9.46
Thailand -9.13
Togo -10.28
Trinidad and Tobago -8.00
Tunisia -9.36
Turkey -9.14
Turkmenistan -7.74
Ukraine -8.31
United Arab Emirates -7.95
United Kingdom -8.75
United Republic of Tanzania -11.00
United States of America -8.03
Uruguay -9.73

Avant toute interprétation du jeu de données affiché, il convient de sélectionner un pays de référence. Nous choisirons ici l’Albanie en guise d’exemple. Nous observons alors que, de part les caractéristiques individuelles de l’Algérie, le \(log(CO2)\) est plus élevé de \(-9.04-9.46=0.42\) unités que celui de l’Albanie. Si nous répétons ce calcul pour l’Angola, on constate que le \(log(CO2)\) est plus élévé de \(-10.05-9.46=-0.59\) unités (ou plus faible de 0.59 unités) que celui de l’Albanie.

Conclusion

Notre base de données contenait 10 variables et 1500 observations. Ces observations étaient définies par des pays à différents points du temps, auxquels nous avons associé une variable correspondant aux émissions de CO2 par habitant, variable que nous cherchions à expliquer par un indicateur parmi d’autres de santé économique en contrôlant l’effet par des variables liées à l’énergie.

Pour expliquer les émissions de CO2 par habitant, nous avions 2 modèles au choix: Modèle pooled sans effets fixes, modèle within avec effets fixes. Après avoir fait des tests, nous avons fini par choisir le modèle within avec effets fixes en utilisant la méthode des moindres carrés généralisés pour éviter tout problème hétéroscedasticité et d’autocorrélation.

Nous concluons que les émissions de CO2 par habitant dépendent effectivement du PIB par habitant en parité du pouvoir d’achat. La relation entre ces deux variables est quadratique : les émissions de CO2 augmentent à mesure qu’un pays s’enrichit. Après l’atteinte plus le dépassement d’un certain seuil de richesse, les émissions entament leur baisse.